背景和目标。域移位是机器学习模型的泛化问题,当训练集的数据分布与模型部署时遇到的数据分布不同时发生的机器学习模型。由于实验条件,设备和捕获设置的方差,这在生物医学图像分段的背景下是常见的。在这项工作中,通过研究肿瘤球状体分割的神经风格转移算法和未配对的图像到图像转换方法来解决这一挑战。方法。我们已经在Spheroid Semonation的上下文中展示了具有4个深入学习分段模型的域移位问题,该模型在训练分布后的图像测试时实现了超过97%的IOU,但在应用于捕获的图像时,其性能下降到84 \%在不同的条件下。为了解决这个问题,我们已经探索了3种风格传输算法(NST,深图象类比和光刻),以及6个未配对的图像到图像转换算法(Compygan,Dualgan,Forkgan,Ganilla,Cut和FastCut) 。这些算法已集成到高级API中,其促进其应用于发生域移位问题的其他上下文。结果。当应用于在不同条件下捕获的图像通过使用样式传输和图像到图像转换算法时,我们大大提高了4分段模型的性能。特别是,有2个样式传输算法(NST和深图谱)和1个未配对的图像到图像转换算法(Cyclegan),可在0.24至76.07的范围内改善模型的IOO。因此,在训练分布之后应用于使用模型获得的类似的性能。
translated by 谷歌翻译
表格是一种广泛类型的基于模板的文档,用于各种各样的领域,包括,等等,管理,医学,金融或保险。由于日常生成的形式增加,这些文件中包括的信息的自动提取大大要求。然而,由于具有不同形式实体位置的模板的巨大分集以及扫描文档的质量,因此在使用扫描形式时,这不是一项直接的任务,以及扫描文档的质量。在此上下文中,存在一个功能由所有形式共享:它们包含作为键值(或标签值)对构建的互连实体的集合以及其他实体,例如标题或图像。在这项工作中,我们通过基于BERT架构组合图像处理技术和文本分类模型来了解以形式的实体链接问题。这种方法实现了最先进的结果,在Funsd DataSet上的F1分数为0.80,关于最佳方法的提高5%。此项目的代码可在https://github.com/mavillot/funsd-entity-linking中获得。
translated by 谷歌翻译
This work presents a set of neural network (NN) models specifically designed for accurate and efficient fluid dynamics forecasting. In this work, we show how neural networks training can be improved by reducing data complexity through a modal decomposition technique called higher order dynamic mode decomposition (HODMD), which identifies the main structures inside flow dynamics and reconstructs the original flow using only these main structures. This reconstruction has the same number of samples and spatial dimension as the original flow, but with a less complex dynamics and preserving its main features. We also show the low computational cost required by the proposed NN models, both in their training and inference phases. The core idea of this work is to test the limits of applicability of deep learning models to data forecasting in complex fluid dynamics problems. Generalization capabilities of the models are demonstrated by using the same neural network architectures to forecast the future dynamics of four different multi-phase flows. Data sets used to train and test these deep learning models come from Direct Numerical Simulations (DNS) of these flows.
translated by 谷歌翻译
This project explores the feasibility of remote patient monitoring based on the analysis of 3D movements captured with smartwatches. We base our analysis on the Kinematic Theory of Rapid Human Movement. We have validated our research in a real case scenario for stroke rehabilitation at the Guttmann Institute5 (neurorehabilitation hospital), showing promising results. Our work could have a great impact in remote healthcare applications, improving the medical efficiency and reducing the healthcare costs. Future steps include more clinical validation, developing multi-modal analysis architectures (analysing data from sensors, images, audio, etc.), and exploring the application of our technology to monitor other neurodegenerative diseases.
translated by 谷歌翻译
生成模型生成的合成数据可以增强医学成像中渴望数据深度学习模型的性能和能力。但是,(1)(合成)数据集的可用性有限,并且(2)生成模型训练很复杂,这阻碍了它们在研究和临床应用中的采用。为了减少此入口障碍,我们提出了Medigan,Medigan是一站式商店,用于验证的生成型号,该型号是开源框架 - 不合骨python图书馆。 Medigan允许研究人员和开发人员仅在几行代码中创建,增加和域名。在基于收集的最终用户需求的设计决策的指导下,我们基于生成模型的模块化组件(i)执行,(ii)可视化,(iii)搜索和排名以及(iv)贡献。图书馆的可伸缩性和设计是通过其越来越多的综合且易于使用的验证生成模型来证明的,该模型由21种模型组成,利用9种不同的生成对抗网络体系结构在4个域中在11个数据集中训练,即乳腺摄影,内窥镜检查,X射线和X射线和X射线镜头,X射线和X型。 MRI。此外,在这项工作中分析了Medigan的3个应用,其中包括(a)启用社区范围内的限制数据共享,(b)研究生成模型评估指标以及(c)改进临床下游任务。在(b)中,扩展了公共医学图像综合评估和报告标准,我们根据图像归一化和特定于放射学特征提取了Fr \'Echet Inception距离变异性。
translated by 谷歌翻译
开发有效的自动分类器将真实来源与工件分开,对于宽场光学调查的瞬时随访至关重要。在图像差异过程之后,从减法伪像的瞬态检测鉴定是此类分类器的关键步骤,称为真实 - 博格斯分类问题。我们将自我监督的机器学习模型,深入的自组织地图(DESOM)应用于这个“真实的模拟”分类问题。 DESOM结合了自动编码器和一个自组织图以执行聚类,以根据其维度降低的表示形式来区分真实和虚假的检测。我们使用32x32归一化检测缩略图作为底部的输入。我们展示了不同的模型训练方法,并发现我们的最佳DESOM分类器显示出6.6%的检测率,假阳性率为1.5%。 Desom提供了一种更细微的方法来微调决策边界,以确定与其他类型的分类器(例如在神经网络或决策树上构建的)结合使用时可能进行的实际检测。我们还讨论了DESOM及其局限性的其他潜在用法。
translated by 谷歌翻译
最近,致力于通过现代机器学习方法预测脑部疾病的最新神经影像学研究通常包括单一模态并依靠监督的过度参数化模型。但是,单一模态仅提供了高度复杂的大脑的有限视图。至关重要的是,临床环境中的有监督模型缺乏用于培训的准确诊断标签。粗标签不会捕获脑疾病表型的长尾谱,这导致模型的普遍性丧失,从而使它们在诊断环境中的有用程度降低。这项工作提出了一个新型的多尺度协调框架,用于从多模式神经影像数据中学习多个表示。我们提出了一般的归纳偏见分类法,以捕获多模式自学融合中的独特和联合信息。分类法构成了一个无解码器模型的家族,具有降低的计算复杂性,并捕获多模式输入的本地和全局表示之间的多尺度关系。我们使用各种阿尔茨海默氏病表型中使用功能和结构磁共振成像(MRI)数据对分类法进行了全面评估,并表明自我监督模型揭示了与疾病相关的大脑区域和多模态链接,而无需在预先访问PRE-PRE-the PRE-the PRE-the PRE-the PRE-PRECTEN NICKES NOCKER NOCKER NOCKER NOCKER NOCKER NOCE访问。训练。拟议的多模式自学学习的学习能够表现出两种模式的分类表现。伴随的丰富而灵活的无监督的深度学习框架捕获了复杂的多模式关系,并提供了符合或超过更狭窄的监督分类分析的预测性能。我们提供了详尽的定量证据,表明该框架如何显着提高我们对复杂脑部疾病中缺失的联系的搜索。
translated by 谷歌翻译
与分析气相色谱法 - 质谱(GC -MS)数据相关的挑战很多。这些挑战中的许多挑战源于以下事实:电子电离可能使由于高度的分裂程度与分子离子信号的损失而难以恢复分子信息。使用GC-MS数据,通常在密切洗脱峰之间共享许多常见的片段离子,因此需要进行复杂的分析方法。其中一些方法是完全自动化的,但是对数据可以在分析过程中引入伪影的数据做出了一些假设。化学计量方法(例如多元曲线分辨率或平行因子分析)特别有吸引力,因为它们是灵活的,并且对数据的假设相对较少 - 理想情况下会导致伪像较少。这些方法确实需要专家用户干预来确定每个区域的最相关区域和适当数量的组件,即$ k $。需要选择自动化区域,以允许使用高级信号反卷积的色谱数据自动批处理处理。在这里,我们提出了一种新的方法,用于自动化,不靶心的感兴趣的选择区域,该方法是根据平方的比率和第二个单数值分解的比率来解释GC-MS数据中存在的多元信息,以选择感兴趣的区域。在色谱图上移动的窗口。假设第一个奇异值主要解释了信号,而第二个奇异值主要解释了噪声,则可以将这两个值之间的关系解释为Fisher比率的概率分布。通过研究该算法不再挑选已知包含信号的色谱区的浓度来测试算法的灵敏度。
translated by 谷歌翻译
前列腺癌是全世界男性癌症第二大的癌症和第六主要原因。专家在诊断前列腺癌期间面临的主要问题是含有肿瘤组织的感兴趣区域(ROI)的定位。目前,在大多数情况下,该ROI的分割是由专家医生手动进行的,但是该程序受到某些患者的检测率低(约27-44%)或过度诊断的困扰。因此,几项研究工作解决了从磁共振图像中自动分割和提取ROI特征的挑战,因为此过程可以极大地促进许多诊断和治疗应用。然而,缺乏明确的前列腺边界,前列腺组织固有的异质性以及多种前列腺形状的多样性使这一过程非常难以自动化。在这项工作中,通过获得的MRI图像数据集对六个深度学习模型进行了培训和分析。来自Dijon中心的医院和Catalunya大学。我们使用分类跨环膜损失函数进行了多种深度学习模型(即U-NET,注意U-NET,密度密度,R2U-NET和R2U-NET)的比较。使用通常用于图像分割的三个指标进行分析:骰子分数,JACCARD索引和均方误差。为我们提供最佳结果分割的模型是R2U-NET,骰子,Jaccard和平均平方误差分别达到0.869、0.782和0.00013。
translated by 谷歌翻译
贝叶斯工作流程通常需要引入滋扰参数,但对于核心科学建模,需要访问边缘后部密度。在这项工作中,我们使用掩盖的自回归流量和内核密度估计器封装边缘后部,使我们能够计算边际kullback-leibler脱离器和边缘贝叶斯模型尺寸,此外还可以生成样品和计算边际对数概率。我们将其应用于暗能量调查的局部宇宙学示例和全局21cm信号实验。除了计算边缘贝叶斯统计数据外,这项工作对于在贝叶斯实验设计,复杂的先验建模和似然仿真中进一步应用也很重要。该技术可在PIP可容纳的代码人造黄油中公开获得。
translated by 谷歌翻译